#каузальная система04.07.2025
Crome: Каузальная система Google DeepMind для надёжного обучения моделей вознаграждения в выравнивании LLM
Google DeepMind и партнёры представили Crome — каузальную систему, которая повышает устойчивость моделей вознаграждения при выравнивании больших языковых моделей, используя контрфактическую аугментацию данных.